OBJECTIF : Analyser la base de données
# Import des données
data <- readRDS("data/data1.rds") # base de données sur laquelle on va appliquer tous les changements
Broken_Devices_Data <- read.csv("data/Broken-Devices-Data1-xlsx.csv",row.names=1) # base de données initiale sur laquelle on pourra se référer pour voir si les chgts ont bien été appliqués
# nombre d'observations
nb_obs <- nrow(data) # 968
# nombre de variables
nb_var <- ncol(data) # 164
Le tableau suivant donne le pourcentage de personnes , dans la base de données, qui ont leur téléphone depuis 2000, depuis 2001…, et le pourcentage de personnes parmis celles-ci qui rencontrent des dysfonctionnements :
## Année.obtention Nombre.de.personnes Nombre_personnes_pbs
## 1 2000 38 0
## 2 2001 150 51
## 3 2002 31 31
## 4 2004 32 32
## 5 2005 64 33
## 6 2006 110 110
## 7 2008 56 56
## 8 2015 158 104
## 9 2016 184 122
## 10 2017 704 325
## 11 2018 1715 890
## 12 2019 2797 1382
## 13 2020 6371 3272
## 14 2021 10909 4197
## 15 2022 12835 5273
## 16 2023 11679 4012
## Pourcentage.de.personnes.avec.pb
## 1 0
## 2 34
## 3 100
## 4 100
## 5 52
## 6 100
## 7 100
## 8 66
## 9 66
## 10 46
## 11 52
## 12 49
## 13 51
## 14 38
## 15 41
## 16 34
Le graphique à barres suivant donne le nombre de personnes , dans la base de données, qui ont leur téléphone depuis 2000, depuis 2001…, et qui recontrent des dysfonctionnements ou pas :
On observe que la plupart des dysfonctionnements ont lieu sur des années récentes d’obtention du smartphone, sur les 5 dernières années même. Les personnes qui rencontrent des dysfonctionnements l’ont en grande majorité depuis 2022 (108 personnes), 80 personnes depuis 2023 et 83 depuis 2021.
## [1] "Pourcentage de personnes dans la base qui rencontrent un pbs et qui ont leur smartphone depuis moins de 5 ans : 38 %"
## [1] "Pourcentage de personnes parmis celles qui rencontrent un pbs qui ont leur smartphone depuis moins de 5 ans : 91 %"
Autre représenation mais sous forme de nuage de points représentant le nombre de dysfonctionnements rencontrés par chacun des propriétaires en fonction de l’année d’obtention de leur smartphone, plus le point est gros plus le nombre de personnes dans le cas concidéré est important :
## Obtention Nb_dysfonctionnements Nb_personnes_concernees
## 1 2001 1 51
## 2 2002 2 31
## 3 2004 3 32
## 4 2005 3 33
## 5 2006 1 55
## 6 2006 3 55
## 7 2008 1 56
## 8 2015 3 104
## 9 2016 2 122
## 10 2017 1 221
## 11 2017 2 41
## 12 2017 4 62
## 13 2018 1 323
## 14 2018 2 294
## 15 2018 3 104
## 16 2018 4 113
## 17 2018 9 56
## 18 2019 1 378
## 19 2019 2 438
## 20 2019 3 148
## 21 2019 4 204
## 22 2019 5 118
## 23 2019 6 40
## 24 2019 9 56
## 25 2020 1 1147
## 26 2020 2 1137
## 27 2020 3 459
## 28 2020 4 260
## 29 2020 5 92
## 30 2020 6 177
## 31 2021 1 2122
## 32 2021 2 1146
## 33 2021 3 438
## 34 2021 4 367
## 35 2021 6 124
## 36 2022 1 2642
## 37 2022 2 1273
## 38 2022 3 731
## 39 2022 4 413
## 40 2022 5 93
## 41 2022 6 40
## 42 2022 7 81
## 43 2023 1 2368
## 44 2023 2 561
## 45 2023 3 555
## 46 2023 4 376
## 47 2023 5 97
## 48 2023 15 54
Regardons maintenant le nombre de personnes ayant rencontré un ou plusieurs dysfonctionnements, en fonction du type d’acquisition de leur téléphone :
On observe que la part de dysfonctionnements est plus grande pour la modalité “je l’ai acheté”, ce qui paraît logique car la modalité en question représente 74% des personnes de la base. Il est donc préférable de regarder la part de dysfonctionnement pour chacune des modalités.
En terme de pourcentage, le tableau suivant nous indique combien de personnes pour chaque modalités a rencontré des dysfonctionnements :
## Acquisition
## 1 Quelqu’un me l’a offert ou donné
## 2 Quelqu’un me l’a prêté
## 3 Je l’ai acheté
## 4 Je l’ai obtenu dans le cadre de mon contrat avec mon opérateur
## 5 Mon employeur me l’a fourni
## 6 Je l’ai loué
## 7 Je ne me souviens pas
## 8 Obtenu par un autre moyen
## Pourcentage.de.personnes.avec.dys
## 1 39
## 2 25
## 3 41
## 4 45
## 5 88
## 6 20
## 7 0
## 8 0
88 % de ceux dont le smartphone a été fourni par l’employeur rencontrent un pb avec, 45% de ceux qui l’ont obtenu dans le cadre d’un contrat avec leur opérateur en rencontrent un aussi, et 41 % de ceux qui l’ont acheté en rencontrent.
La question posée était : Avez-vous tenté de résoudre ou de faire résoudre le(s) dysfonctionnement(s) rencontré(s) ?
Le graphe suivant montrent le pourcentage de personnes ayant répondu à chaque modalités, parmis celles ayant indiqué qu’elles ont rencontré un ou plusieurs dysfonctionnements :
df <- data.frame(Resolution = Categorie,Nb_dys = round(matrice_REP[2,]), Pourcent = round(matrice_REP[2, ]*100/sum(matrice_REP[2,])))
df
## Resolution Nb_dys Pourcent
## 1 Yes, and the problem is resolved 7358 19
## 2 Yes, but the problem could not be resolved 9966 25
## 3 No, the problem resolved itself after a while 5767 15
## 4 No, maybe later 7404 19
## 5 No, I don't think I'll try to solve the problem 9259 23
Les problèmes ayant tenté d’être résolus représentent 32% des problèmes rencontrés et ceux ayant été résolus représentent 18%.
Les 10 principaux dysfonctionnements rencontrés sont les suivants :
Il serait intéressant de savoir parmis ces 10 dysfonctionnements combien ont tenté dêtre résout et combien ont été résolu ? Le tableau suivant nous apporte plus de détails :
## Dysfonctionnement Nb_personnes
## 1 Problème de batterie 114
## 2 Stockage saturé 93
## 3 Problème de lenteur 83
## 4 Problèmes avec des applications 54
## 5 Problème de Wi-Fi 42
## 6 Problème avec l’écran 40
## 7 Dysfonctionnement logiciel 36
## 8 Problème de sensibilité du tactile 34
## 9 Problème de chargement 33
## 10 Applications ne pouvant pas être téléchargées ou mises à jour 32
## Nb_personnes_résolu Pourcentage_Nb_personnes_résolu
## 1 1258 1104
## 2 1525 1640
## 3 1068 1287
## 4 1193 2210
## 5 901 2145
## 6 375 937
## 7 807 2242
## 8 476 1401
## 9 678 2054
## 10 467 1459
La plus grande part observée concerne le dysfonctionnement “Problème de chargement” qui pour 33 pbs observés a été résolu dans 10 de ces cas, ce qui représente une part de 30% de résolution. Le graphe suivant permet de visualiser cette répartiton :
C’est 33% des personnes ayant rencontré un ou plusieurs dysfonctionnements qui n’ont pas réussi à résoudre le ou les dysfonctionnements.
La question posée était : Combien de temps s’est écoulé approximativement entre le moment où vous avez décelé le(s) dysfonctionnement(s) et le moment où vous avez tenté de le(s) résoudre ou de le(s) faire résoudre ?
On s’intéresse donc aux personnes ayant répondu aux 2 modalités suivantes, lorsqu’on leur a demandé s’il avait tenté de résoudre le problème, (c’est à dire 32% des dysfonctionnements) :
1 : Oui et le problème est résolu
2 : Oui mais le problème n’a pas pu être résolu
Voici les réponses obtenues :
df <- data.frame(Cohabitation = label_COHABITATION, Nb_dys =round( matrice[2,]),Pourcent =round(matrice[2, ]*100/total) )
df
## Cohabitation Nb_dys Pourcent
## 1 Dès que j’ai décelé le dysfonctionnement 6656 38
## 2 Moins d’un mois 5670 33
## 3 Entre 1 et 6 mois 2607 15
## 4 Entre 6 mois et 2 ans 1283 7
## 5 Plus de deux ans 633 4
## 6 Je ne sais pas 475 3
39 % des problèmes résolus l’ont été dés que le propriétaire du smartphone l’a décelé. 32% ont été résolus en moins d’un mois et 15% entre 1 et 6 mois.
Le genre aurait-il une incidence sur ce temps de cohabitation ?
df_T1 <- data.frame(Categorie = Categorie, Nb_dys = round(matrice_femmes[2, ]) , Pourcent =round(matrice_femmes[2, ]*100/total), Genre = "Femmes")
df_T2 <- data.frame(Categorie = Categorie, Nb_dys = round(matrice_hommes[2, ]) ,Pourcent = round(matrice_hommes[2, ]*100/total), Genre = "Hommes")
# Combiner les deux data frames
df_combined <- rbind(df_T1, df_T2)
df <- df_combined %>%
arrange( Categorie,Genre)
df
## Categorie Nb_dys Pourcent Genre
## 1 Dès que j’ai décelé le dysfonctionnement 3747 22 Femmes
## 2 Dès que j’ai décelé le dysfonctionnement 2910 17 Hommes
## 3 Moins d’un mois 1998 12 Femmes
## 4 Moins d’un mois 3672 21 Hommes
## 5 Entre 1 et 6 mois 1372 8 Femmes
## 6 Entre 1 et 6 mois 1235 7 Hommes
## 7 Entre 6 mois et 2 ans 592 3 Femmes
## 8 Entre 6 mois et 2 ans 691 4 Hommes
## 9 Plus de deux ans 161 1 Femmes
## 10 Plus de deux ans 471 3 Hommes
## 11 Je ne sais pas 225 1 Femmes
## 12 Je ne sais pas 250 1 Hommes
Les hommes semblent régler le problème en moins d’un mois (20%) alors que les femmes semblent le régler dès le dysfonctionnement est décelé (22%).
Autre représentation mais sous forme de boites à moustache (distribution du nombre de personnes par temps de cohabitation) :
Le graphe suivant donne les gênes qu’ont ressentis les propriétaires suite au(x) dysfonctionnement(s) qu’ils ont rencontré :
## Gêne Nb_dys Pourcent
## 1 Très gênant 14406 30
## 2 Plutôt gênant 20888 44
## 3 Plutôt pas gênant 7894 17
## 4 Pas gênant du tout 1233 3
47% des problèmes rencontrés ont été ressentis comme étant plutôt gênant, 32% comme étant trés gênant, 18% comme étant plutôt pas gênant et 3% comme pas gênant du tout.
La question posée était :A partir de quel moment approximativement avez-vous décelé les premiers dysfonctionnements sur votre smartphone ?
C’est 25% de personnes qui s’en sont rendus compte entre 3 mois et 1 an, et 24% entre 1 an et 2 ans.
Est ce que le degré de gêne ressentis pour chaques dysfonctionnements est différent selon les différents temps de cohabitation avec le ou les dysfonctionnements ?
df_T1 <- data.frame(Categorie = Categorie,Nb_dys = round(matrice[2,]), Pourcent = round(matrice[2,]*100/total), GÊNE = "Trés gênant")
df_T2 <- data.frame(Categorie = Categorie,Nb_dys = round(matrice[3,]), Pourcent = round(matrice[3,]*100/total), GÊNE = "Plutôt gênant")
df_T3 <- data.frame(Categorie = Categorie,Nb_dys = round(matrice[4,]), Pourcent = round(matrice[4,]*100/total), GÊNE = "Plutôt pas gênant")
df_T4 <- data.frame(Categorie = Categorie,Nb_dys = round(matrice[5,]), Pourcent = round(matrice[5,]*100/total), GÊNE = "Pas gênant du tout")
# Combiner les deux data frames
df_combined <- rbind(df_T1, df_T2, df_T3, df_T4)
df <- df_combined %>%
arrange( Categorie,GÊNE)
df
## Categorie Nb_dys Pourcent GÊNE
## 1 Dès que j’ai décelé le dysfonctionnement 0 0 Pas gênant du tout
## 2 Dès que j’ai décelé le dysfonctionnement 2266 13 Plutôt gênant
## 3 Dès que j’ai décelé le dysfonctionnement 1190 7 Plutôt pas gênant
## 4 Dès que j’ai décelé le dysfonctionnement 3200 18 Trés gênant
## 5 Moins d’un mois 0 0 Pas gênant du tout
## 6 Moins d’un mois 2987 17 Plutôt gênant
## 7 Moins d’un mois 426 2 Plutôt pas gênant
## 8 Moins d’un mois 2258 13 Trés gênant
## 9 Entre 1 et 6 mois 0 0 Pas gênant du tout
## 10 Entre 1 et 6 mois 1401 8 Plutôt gênant
## 11 Entre 1 et 6 mois 325 2 Plutôt pas gênant
## 12 Entre 1 et 6 mois 881 5 Trés gênant
## 13 Entre 6 mois et 2 ans 0 0 Pas gênant du tout
## 14 Entre 6 mois et 2 ans 654 4 Plutôt gênant
## 15 Entre 6 mois et 2 ans 218 1 Plutôt pas gênant
## 16 Entre 6 mois et 2 ans 411 2 Trés gênant
## 17 Plus de deux ans 0 0 Pas gênant du tout
## 18 Plus de deux ans 331 2 Plutôt gênant
## 19 Plus de deux ans 183 1 Plutôt pas gênant
## 20 Plus de deux ans 119 1 Trés gênant
## 21 Je ne sais pas 0 0 Pas gênant du tout
## 22 Je ne sais pas 280 2 Plutôt gênant
## 23 Je ne sais pas 55 0 Plutôt pas gênant
## 24 Je ne sais pas 139 1 Trés gênant
On voit que lorsque le dysfonctionnement a été décelé dés son apparition, le problème a été ressentis comme étant trés gênant. Lorsque le propriétaire a cohabité avec le dysfonctionnement moins d’un mois le dysfonctionnement a été ressentis comme étant majoritairement plutôt gênant.
La question posée était : Vous nous avez déclaré ne pas avoir tenté de résoudre les dysfonctionnements suivants de votre smartphone. Envisagez-vous de tenter de le(s) résoudre ?
Les réponses possibles étaient :
1 : Oui, par moi-même
2 : Oui, par le SAV ou un réparateur
3 : Oui, par une connaissance
4 : Pas pour l’instant
5 : Non
Cela ne concerne que les personnes ayant répondu aux modalités 4(Non, peut être plus tard) et 5 (Non, je ne pense pas tenter de résoudre le problème) à la question “Avez vous tenté de résoudre le problème” Ce qui représente 40% des personnes ayant rencontré des dysfonctionnements.
Diagramme en barres pour chaques CSPs en fonction de l’intention de réparation :
# Affichage du tableau de valeurs
df <- df_combined %>%
arrange(Categorie,CSP)
df
## Categorie valeurs CSP
## 1 Oui, par moi-même 5 Autre Inactifs
## 2 Oui, par moi-même 9 CSP+
## 3 Oui, par moi-même 5 CSP-
## 4 Oui, par moi-même 2 Retraités
## 5 Oui, par moi-même 4 Étudiants
## 6 Oui, par le SAV ou un réparateur 2 Autre Inactifs
## 7 Oui, par le SAV ou un réparateur 10 CSP+
## 8 Oui, par le SAV ou un réparateur 12 CSP-
## 9 Oui, par le SAV ou un réparateur 7 Retraités
## 10 Oui, par le SAV ou un réparateur 1 Étudiants
## 11 Oui, par une connaissance 0 Autre Inactifs
## 12 Oui, par une connaissance 6 CSP+
## 13 Oui, par une connaissance 4 CSP-
## 14 Oui, par une connaissance 4 Retraités
## 15 Oui, par une connaissance 2 Étudiants
## 16 Pas pour l’instant 4 Autre Inactifs
## 17 Pas pour l’instant 14 CSP+
## 18 Pas pour l’instant 15 CSP-
## 19 Pas pour l’instant 9 Retraités
## 20 Pas pour l’instant 10 Étudiants
## 21 Non 7 Autre Inactifs
## 22 Non 14 CSP+
## 23 Non 6 CSP-
## 24 Non 6 Retraités
## 25 Non 10 Étudiants
1 ) Comment les propriètaires ont-ils acquis leur smarthphone dans la base de données ? :
Représentation sous forme de nuage de points, afin de mieux voir la répartition :
On voit clairement que la ligne correspondant au fait que les propriétaires ont acheté leur téléphone est continue, ce qui explique que le nombre de personnes dans ce cas là est important, contrairement à la ligne indiquant que le propriétaire l’a obtenu d’une autre manière, qui ne contient qu’un seul point. Le tableau suivant donne plus de détails :